查看原文
其他

数据治理连载漫画:什么是数据质量?(上)

数据学堂 2022-11-08


PRIMERS

引    子

大数据人工智能技术在日新月异的发展,各个行业领域的数据量都在迅猛增长。有研究发现,近年来,数字数据的数量每3年多就会翻一番。金融行业在发展中积攒了大量客户信息和数据信息,借助这些数据能更好地挖掘有价值的信息资源。


在说数据质量之前,我们先来看一个小故事。

 

降落伞的真实故事

在第二次世界大战中期,

在当时,美国空军降落伞的安全度不够完美,

经过厂商努力的改善,良品率已经达到了99.9%,

应该说这个良品率

即使当今社会许多企业也很难达到,

但美国空军却要求降落伞公司的良品率必须达到

100%

于是,降落伞制造商的负责人便与之商讨此事,

看能否降低这个标准?

厂商认为当前这个程度已接近完美了,

没有必要再改了,

美国空军一口回绝“品质没有折扣”



后来,军方改变了检验降落伞品质的方法;

是从厂商交付的降落伞中,

随机挑出一个,

让厂商负责人装备上身后亲自从飞行中的机身跳下。

这个方法实施后,不良率立刻变成零。

数据质量是什么

数据质量是指数据满足准确性、完整性、时效性、一致性、唯一性、关联性、适当性、有效性及可获取性的程度。具体含义如下:

(一)  准确性:数据是否能够准确、真实反映实际信息,以及数据格式是否符合数据标准的要求;

(二)  完整性:业务操作所需要的数据是否完备;


(三)  时效性:数据是否能够及时被获取,以及是否能够反应当前业务情况;

(四)  一致性:反映同一业务实体的数据及其属性是否具有一致的定义和含义;


(五)  唯一性:数据在数据集中不存在重复值;


(六)  关联性:数据是否具有明确的关联关系,数据关联关系是否被准确定义,数据是否符合数据间的关联关系;

(每个人的机票和飞机座位,都有明确的关联关系。


(七)  适当性:数据是否在可控、安全的范围内发布和使用;



(八)  有效性:数据符合已定义的格式规范和业务规则;


(九)  可获取性:数据易于理解,且数据格式满足用户需要。



本文来源山西农信
点击文末阅读原文,获取更多干货好文
觉得本文有用,欢迎转发分享,谢谢


<END>



大家都在看:
1、IBM数字化中台(PPT)
2、大数据资产管理实战(PPT)3、主数据管理(MDM)项目建设落地方案
4、数据中台建设方案(PPT)
5、华为税务大数据解决方案(PPT)6、企业级数据治理解决方案(PPT)7华为大数据中台架构设计分享(PPT)8华为数字化转型与数据管理实践(PPT)
9、阿里巴巴数据中台实践分享(PPT)10、集团级财务数据中台建设方案(PPT)11、数据治理体系建设方案(PPT)12、企业数字化转型之道(附PDF下载)13、国家标准:数据治理规范(附下载)14、数据治理已成为数据中台的必争之地15、为什么85%的大数据项目总是失败?



数据学堂


欢迎扫码添加歪老师个人微信(data-school),邀请加入数据学堂数据专业微信群,与业内大咖一起识数据、存数据、管数据、治数据、用数据!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存